Model Selection

4-bit quantization efficient inference

# 4-bit quantization efficient inference

A 12-billion-parameter large language model optimized for speed, efficiency, and contextual accuracy, supporting RAG-enhanced technology and a 128k context window.

Large Language Model

riple-saanvi-lab

Meta Llama 3 8B Instruct Hf AWQ

Meta Llama 3 series large language model, featuring an 8 billion parameter instruction fine-tuned text generation model optimized for dialogue scenarios.

Large Language Model

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase